7.1 LLM-as-a-Judge의 개념적 정의와 오라클로서의 역할 7.1.1 전통적 테스트 오라클과 의미론적(Semantic) 평가의 간극 7.1.2 확률적 모델을 검증 도구로 사용할 때의 역설과 해결 방안 7.1.3 하이브리드 오라클: 결정론적 규칙(Rule-based)과 AI 판단의 결합 모델 7.1.4 Reference-based 평가와 Reference-free 평가의 차이점 및 적용 시나리오 7.1.5 LLM-as-a-Judge 도입이 적합한 테스트 케이스 유형 분석